智能论文笔记

Reliability Assessment and Safety Arguments for Machine Learning Components in Assuring Learning-Enabled Autonomous Systems

Xingyu Zhao , Wei Huang , Vibhav Bharti , Yi Dong , Victoria Cox , Alec Banks , Sen Wang , Sven Schewe , Xiaowei Huang

分类：人工智能 | 机器学习 | 机器人

2021-11-30

嵌入在自主系统中的机器学习（ML）组件的增加使用 - 所谓的启用学习的系统（LES） - 导致压力需要确保其功能安全性。至于传统的功能安全，在工业和学术界的新兴共识是为此目的使用保证案例。通常，保证案例支持可靠性的支持权，支持安全性，并且可以被视为组织争论和从安全分析和可靠性建模活动产生的证据的结构化方式。虽然这些保证活动传统上由基于协商一致的标准，但由于ML模型的特点和设计，在安全关键应用中，LES构成了新的挑战。在本文中，我们首先向LES提出了一种强调定量方面的总体保证框架，例如，打破系统级安全目标与可靠性指标中所述的组件级要求和支持索赔。然后，我们向ML分类器介绍一种新的模型 - 不可能可靠性评估模型（RAM），该分类器利用操作简档和鲁棒性验证证据。我们讨论了模型假设以及评估我们RAM揭示的ML可靠性的固有挑战，并提出了实用的解决方案。还基于RAM开发了较低ML组件级的概率安全争论。最后，为了评估和展示我们的方法，我们不仅对合成/基准数据集进行实验，还展示了我们对模拟中自动水下车辆的综合案例研究的方法。

translated by 谷歌翻译

Robust Speech Recognition via Large-Scale Weak Supervision

Alec Radford , Jong Wook Kim , Tao Xu , Greg Brockman , Christine McLeavey , Ilya Sutskever

分类：自然语言处理 | 机器学习

2022-12-06

We study the capabilities of speech processing systems trained simply to predict large amounts of transcripts of audio on the internet. When scaled to 680,000 hours of multilingual and multitask supervision, the resulting models generalize well to standard benchmarks and are often competitive with prior fully supervised results but in a zero-shot transfer setting without the need for any fine-tuning. When compared to humans, the models approach their accuracy and robustness. We are releasing models and inference code to serve as a foundation for further work on robust speech processing.

translated by 谷歌翻译

Scalable Gaussian Process Hyperparameter Optimization via Coverage Regularization

Killian Wood , Alec M. Dunton , Amanda Muyskens , Benjamin W. Priest

分类：机器学习 | (统计)机器学习

2022-09-22

高斯工艺（GPS）是贝叶斯非参数模型，由于其准确性和天然不确定性定量（UQ），因此在各种应用中流行。调整GP超参数对于确保预测准确性和不确定性的有效性至关重要。独特地估计多个超参数，例如Matern内核也可能是一个重大挑战。此外，大规模数据集中的培训GPS是一个高度活跃的研究领域：传统的最大似然超参数训练需要二次记忆以形成协方差矩阵并具有立方训练的复杂性。为了解决可扩展的超参数调整问题，我们提出了一种新型算法，该算法估算了Matern内核中的平滑度和长度尺度参数，以提高所得预测不确定性的鲁棒性。使用与超参数估计算法MUYGPS提供的计算框架中的合并预测算法相似的新型损失函数，我们在数值实验中证明了高度可伸缩性，同时保持了高度可伸缩性。

translated by 谷歌翻译

AIR-JPMC@SMM4H'22: Classifying Self-Reported Intimate Partner Violence in Tweets with Multiple BERT-based Models

Alec Candidato , Akshat Gupta , Xiaomo Liu , Sameena Shah

分类：自然语言处理

2022-09-22

本文介绍了我们对SMM4H 2022共享任务的提交，内容涉及自我报告的亲密伴侣暴力在Twitter上（英语）。这项任务的目的是准确确定给定推文的内容是否证明了某人报告自己的亲密伴侣暴力经历。提交的系统是五个罗伯塔模型组成的合奏，每个模型各自在验证数据集上由各自的F1分数加权。该系统的性能比基线要好13％，并且是该共享任务的总体性能最佳系统。

translated by 谷歌翻译

Efficiency Evaluation of Banks with Many Branches using a Heuristic Framework and Dynamic Data Envelopment Optimization Approach: A Real Case Study

Vahid Kayvanfar , Hamed Baziyad , Shaya Sheikh , Frank Werner

分类：机器学习

2022-09-11

评估组织内组织和分支机构的效率对于经理来说是一个具有挑战性的问题。评估标准允许组织对其内部单位进行排名，确定其在竞争对手方面的立场，并实施改进和发展目的的策略。在评估银行分支机构的方法中，非参数方法吸引了近年来研究人员的注意。最广泛使用的非参数方法之一是数据包络分析（DEA），可带来有希望的结果。但是，静态DEA方法并未考虑模型中的时间。因此，本文使用动态DEA（DDEA）方法在三年内评估伊朗银行的分支机构（2017-2019）。然后将结果与静态DEA进行比较。对分支进行排名后，使用K-均值方法聚类。最后，引入了一种全面的敏感性分析方法，以帮助管理人员决定更改变量以将分支从一个群集转移到更有效的变量。

translated by 谷歌翻译

Light curve completion and forecasting using fast and scalable Gaussian processes (MuyGPs)

Imène R. Goumiri , Alec M. Dunton , Amanda L. Muyskens , Benjamin W. Priest , Robert E. Armstrong

分类： (统计)机器学习

2022-08-31

明显大小的时间变化（称为光曲线）是望远镜在长时间内捕获的感兴趣的观察统计。光曲线提供了空间域意识（SDA）目标（例如对象识别或姿势估计）作为潜在变量推理问题等目标的探索。与较高的精确仪器相比，来自货架上商业架子（COTS）摄像机的地面观测仍然很便宜，但是，有限的传感器可用性与嘈杂的观察结果相结合，可能会产生可能难以建模的gappy时间序列数据。这些外部因素混淆了对光曲线的自动开发，这使光曲线预测和外推成为应用的关键问题。传统上，使用基于扩散或基于示例的方法解决了图像或时间序列的完成问题。最近，由于学习复杂的非线性嵌入方面的经验成功，深度神经网络（DNNS）已成为首选工具。但是，DNN通常需要大量的培训数据，而这些数据不一定在查看单个卫星的光曲线的独特功能时可用。在本文中，我们提出了一种新的方法，可以使用高斯工艺（GPS）预测光曲线的缺失和未来数据点。 GPS是非线性概率模型，可推断后验分布在功能上并自然量化不确定性。但是，GP推理和培训的立方缩放是其在应用中采用的主要障碍。特别是，单个光曲线可以具有数十万个观测值，这远远超出了单个机器上常规GP的实际实现极限。因此，我们采用MUYGP，这是一种可扩展的框架，用于使用最近的邻居稀疏和局部交叉验证的GP模型的超参数估计。 muygps ...

translated by 谷歌翻译

HTML版本

Oracle-free Reinforcement Learning in Mean-Field Games along a Single Sample Path

Muhammad Aneeq uz Zaman , Alec Koppel , Sujay Bhatt , Tamer Başar

分类：机器学习

2022-08-24

我们考虑在平均场比赛中在线加强学习。与现有作品相反，我们通过开发一种使用通用代理的单个样本路径来估算均值场和最佳策略的算法来减轻对均值甲骨文的需求。我们称此沙盒学习为其，因为它可以用作在多代理非合作环境中运行的任何代理商的温暖启动。我们采用了两种时间尺度的方法，在该方法中，平均场的在线固定点递归在较慢的时间表上运行，并与通用代理更快的时间范围内的控制策略更新同时进行。在足够的勘探条件下，我们提供有限的样本收敛保证，从平均场和控制策略融合到平均场平衡方面。沙盒学习算法的样本复杂性为$ \ Mathcal {o}（\ epsilon^{ - 4}）$。最后，我们从经验上证明了沙盒学习算法在交通拥堵游戏中的有效性。

translated by 谷歌翻译

HTML版本

Auto-ViT-Acc: An FPGA-Aware Automatic Acceleration Framework for Vision Transformer with Mixed-Scheme Quantization

Zhengang Li , Mengshu Sun , Alec Lu , Haoyu Ma , Geng Yuan , Yanyue Xie , Hao Tang , Yanyu Li , Miriam Leeser , Zhangyang Wang

分类：计算机视觉 | 机器学习

2022-08-10

视觉变压器（VIT）正在出现，并且在计算机视觉任务中的准确性显着提高。但是，它们的复杂架构和巨大的计算/存储需求对新硬件加速器设计方法施加了紧迫的需求。这项工作提出了基于提议的混合速度量化的FPGA感知自动VIT加速框架。据我们所知，这是探索模型量化的第一个基于FPGA的VIT加速框架。与最先进的VIT量化工作（仅无硬件加速的算法方法）相比，我们的量化在相同的位宽度下可实现0.47％至1.36％的TOP-1精度。与32位浮点基线FPGA加速器相比，我们的加速器在框架速率上的提高约为5.6倍（即56.8 fps vs. 10.0 fps），对于DeitBase的ImagEnet数据集，精度下降了0.71％。

translated by 谷歌翻译

Task-Relevant Failure Detection for Trajectory Predictors in Autonomous Vehicles

Alec Farid , Sushant Veer , Boris Ivanovic , Karen Leung , Marco Pavone

分类：机器人

2022-07-25

在现代自治堆栈中，预测模块对于在其他移动代理的存在下计划动作至关重要。但是，预测模块的失败会误导下游规划师做出不安全的决定。确实，轨迹预测任务固有的高度不确定性可确保这种错误预测经常发生。由于需要提高自动驾驶汽车的安全而不受损害其性能的需求，我们开发了一个概率运行时监视器，该监视器检测到何时发生“有害”预测故障，即与任务相关的失败检测器。我们通过将轨迹预测错误传播到计划成本来推理其对AV的影响来实现这一目标。此外，我们的检测器还配备了假阳性和假阴性速率的性能度量，并允许进行无数据校准。在我们的实验中，我们将检测器与其他各种检测器进行了比较，发现我们的检测器在接收器操作员特征曲线下具有最高的面积。

translated by 谷歌翻译

$\texttt{FedBC}$: Calibrating Global and Local Models via Federated Learning Beyond Consensus

Amrit Singh Bedi , Chen Fan , Alec Koppel , Anit Kumar Sahu , Brian M. Sadler , Furong Huang , Dinesh Manocha

分类：机器学习

2022-06-22

在联合学习（FL）中，通过跨设备的模型更新进行合作学习全球模型的目的倾向于通过本地信息反对个性化的目标。在这项工作中，我们通过基于多准则优化的框架以定量的方式校准了这一权衡，我们将其作为一个受约束的程序进行了：设备的目标是其本地目标，它试图最大程度地减少在满足非线性约束的同时，以使其满足非线性约束，这些目标是其本地目标。量化本地模型和全局模型之间的接近度。通过考虑该问题的拉格朗日放松，我们开发了一种算法，该算法允许每个节点通过查询到一阶梯度Oracle将其Lagrangian的本地组件最小化。然后，服务器执行Lagrange乘法器上升步骤，然后进行Lagrange乘法器加权步骤。我们称这种实例化的原始偶对方法是联合学习超出共识（$ \ texttt {fedBc} $）的实例。从理论上讲，我们确定$ \ texttt {fedBc} $以与最算好状态相匹配的速率收敛到一阶固定点，直到额外的错误项，取决于由于接近性约束而产生的公差参数。总体而言，该分析是针对非凸鞍点问题的原始偶对偶的方法的新颖表征。最后，我们证明了$ \ texttt {fedBc} $平衡了整个数据集（合成，MNIST，CIFAR-10，莎士比亚）的全球和本地模型测试精度指标，从而与艺术现状达到了竞争性能。

translated by 谷歌翻译